การแปลงข้อมูลที่เก็บมาอย่างดิบจากแหล่งต้นทางให้เป็นโครงสร้างที่มีระเบียบ วัตถุในภาษา R คือกระบวนการทางเทคนิคที่จำเป็นสำหรับการวิเคราะห์เชิงความน่าจะเป็น ก่อนที่จะสร้างแบบจำลองการแจกแจง เราต้องเรียนรู้พื้นฐานด้าน การนำเข้าข้อมูล และรายละเอียดเชิงโครงสร้างระหว่างรายการ (lists), เมทริกซ์ (matrices) และเฟรมข้อมูล (data frames)
1. การนำเข้าข้อมูลอย่างมีโครงสร้าง
การนำเข้าข้อมูลผ่าน scan() มักจะต้องใช้ โครงสร้างรายการปลอม (dummy list structure) เพื่อกำหนดประเภทของตัวแปร (เช่น list(id="", x=0)) ซึ่งช่วยให้ข้อมูลภายนอกจากไฟล์ เช่น input.dat ถูกประมวลผลให้กลายเป็นองค์ประกอบที่จัดการได้ง่าย แทนที่จะเป็นเวกเตอร์แบนราบ
2. การจัดระเบียบตามมิติ
ในขณะที่ เมทริกซ์ ใช้สำหรับเซตของตัวเลขที่มีลักษณะเหมือนกัน (โดยใช้ byrow=TRUE) ส่วน data.frame() ทำหน้าที่เป็นสะพานสำคัญในการสร้างแบบจำลองทางสถิติ ช่วยให้ชนิดข้อมูลที่หลากหลายสามารถอยู่ร่วมกันได้
3. การเข้าถึงตัวแปร
การเข้าถึงข้อมูลเพื่อการอนุมาน ต้องใช้การดัชนีผ่าน inp[[1]] หรือคอลัมน์ที่มีชื่อ เช่น inp$id. ฟังก์ชันเช่น attach() ช่วยให้ตัวแปรภายใน วัตถุทั้งหมด (เช่น eruptions) สามารถเข้าถึงได้โดยตรง โดยไม่ต้องดัชนีซ้ำ ๆ